<!DOCTYPE HTML>
<html>

<head>
	<link rel="bookmark"  type="image/x-icon"  href="/img/logo.jpg"/>
	<link rel="shortcut icon" href="/img/logo.jpg">
	
			    <title>
    北望你的安
    </title>
    <meta charset="utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1, user-scalable=no" />
    <link rel="stylesheet" href="/css/mic_main.css" />
    <link rel="stylesheet" href="/css/dropdownMenu.css" />
    <meta name="keywords" content="北望你的安" />
    
    	<script async src="//busuanzi.ibruce.info/busuanzi/2.3/busuanzi.pure.mini.js"></script>
	 
    <noscript>
        <link rel="stylesheet" href="/css/noscript.css" />
    </noscript>
    <style type="text/css">
        body:before {
          content: ' ';
          position: fixed;
          top: 0;
          background: url('/img/bg.jpg') center 0 no-repeat;
          right: 0;
          bottom: 0;
          left: 0;
          background-size: cover; 
        }
    </style>

			    
  


    <script src="/js/jquery.min.js"></script>
    <script src="/js/jquery.scrollex.min.js"></script>
    <script src="/js/jquery.scrolly.min.js"></script>
    <script src="/js/skel.min.js"></script>
    <script src="/js/util.js"></script>
    <script src="/js/main.js"></script>
	
</head>
    
		
<!-- Layouts -->



<!--  代码渲染  -->
<link rel="stylesheet" href="/css/prism_coy.css" />
<link rel="stylesheet" href="/css/typo.css" />
<!-- 文章页 -->
<body class="is-loading">
    <!-- Wrapper 外包 s-->
    <div id="wrapper" class="fade-in">
        <!-- Intro 头部显示 s -->
        <!-- Intro 头部显示 e -->
        <!-- Header 头部logo start -->
        <header id="header">
    <a href="/" class="logo">Krystalan</a>
</header>
        <!-- Nav 导航条 start -->
        <nav id="nav" class="special" >
            <ul class="menu links" >
			<!-- Homepage  主页  --> 
			<li >
	            <a href="/" rel="nofollow">主页</a>
	        </li>
			<!-- categories_name  分类   --> 
	        
	        <li class="active">
	            <a href="#s1">分类</a>
	                    <ul class="submenu">
	                        <li>
	                        <a class="category-link" href="/categories/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/">强化学习</a></li><li><a class="category-link" href="/categories/%E6%95%B0%E5%AD%A6/">数学</a></li><li><a class="category-link" href="/categories/%E7%AE%97%E6%B3%95/">算法</a></li><li><a class="category-link" href="/categories/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/">自然语言处理</a></li><li><a class="category-link" href="/categories/%E9%9A%8F%E7%AC%94/">随笔</a>
	                    </ul>
	        </li>
	        
	        <!-- archives  归档   --> 
	        
	        
		        <!-- Pages 自定义   -->
		        
		        <li>
		            <a href="/tags/" title="标签">
		                标签
		            </a>
		        </li>
		        
		        <li>
		            <a href="/gallery/" title="相册">
		                相册
		            </a>
		        </li>
		        


            </ul>
            <!-- icons 图标   -->
			<ul class="icons">
                    
                    <li>
                        <a title="github" href="https://github.com/krystalan" target="_blank" rel="noopener">
                            <i class="icon fa fa-github"></i>
                        </a>
                    </li>
                    
                    <li>
                        <a title="500px" href="https://www.zhihu.com/people/krystalzhu-an" target="_blank" rel="noopener">
                            <i class="icon fa fa-500px"></i>
                        </a>
                    </li>
                    
			</ul>
</nav>

        <div id="main" >
            <div class ="post_page_title_img" style="height: 25rem;background-image: url(/img/6.jpg);background-position: center; background-repeat:no-repeat; background-size:cover;-moz-background-size:cover;overflow:hidden;" >
                <a href="#" style="padding: 4rem 4rem 2rem 4rem ;"><h2 >文本摘要的一些探索</h2></a>
            </div>
            <!-- Post -->
            <div class="typo" style="padding: 3rem;">
                <h1 id="文本摘要的一些探索"><a href="#文本摘要的一些探索" class="headerlink" title="文本摘要的一些探索"></a>文本摘要的一些探索</h1><h2 id="3月12日随笔"><a href="#3月12日随笔" class="headerlink" title="3月12日随笔"></a>3月12日随笔</h2><p>这篇文章先开着，准备写一下自己毕设的项目，虽然我觉得很水，在创新点上没有做很多工作，但确实解决了遇到了问题。<br>将抽取式摘要、生成式摘要、文本分类、NER同时应用到了一个框架里，组成了一个大的pipeline式的模型。最后产生了不错的效果。<br>我想等我毕设答辩完之后将这个工作记录下来。<br>今天也遇到了一些不顺心的事情，希望自己能够很好地调整起来，做自己想做的事情，投入到自己热爱的工作当中，希望自己成长，希望他人能给自己压力，希望能在博客上发发牢骚，然后再去努力工作。<br>纪念一下毕设写到了14K字，之后再写一下实验结果、分析，参考文献和致谢就OK了。<br><img src="/images/TS/1.jpg" alt="人工评估"><br>写了一个问卷，让大家帮忙做文本摘要的评估哈哈哈哈哈，希望评估结果和自己的实验预期相符吧~  </p>
<h2 id="3月13日随笔"><a href="#3月13日随笔" class="headerlink" title="3月13日随笔"></a>3月13日随笔</h2><p>得到了一些人工测评的反馈，得到了非常好的效果！<br><img src="/images/TS/2.jpg" alt="人工评估"><br><img src="/images/TS/3.jpg" alt="人工评估"><br>虽然ROUGE降低，但人工评估的标准变得更好。</p>
<p>由于下周三轮到自己做论文分享，所以写了一篇文摘的论文笔记：<u><a href="https://wangjiaan.xyz/2020/03/13/TextSummarizationPaper" target="_blank" rel="noopener">《2019 ACL 文摘论文分享》</a></u>   </p>
<h2 id="3月14日随笔"><a href="#3月14日随笔" class="headerlink" title="3月14日随笔"></a>3月14日随笔</h2><p>把毕设搞完了，PaperPass查重8%，终于结束了233<br><img src="/images/TS/4.jpg" alt="PaperPass">  </p>
<h2 id="3月20日随笔"><a href="#3月20日随笔" class="headerlink" title="3月20日随笔"></a>3月20日随笔</h2><p>这周写了两项专利，都是与文本摘要相关的，其中一个是单文档文本摘要，另一个是多模态文本摘要（文字+图像）<br>这周主要看了3、4篇多模态的文本摘要论文，发现很多都是针对文本+视频的，有关于文本+图像的还是比较少的。<br>而且发现感觉不管是什么任务下的多模态版本，其基本思路都是利用NLP的预训练语言模型提取文本信息，再用CV的预训练模型提取图像或视频信息再做特征融合，融合一般有两种：拼接或Attention。</p>
<h2 id="3月23日随笔"><a href="#3月23日随笔" class="headerlink" title="3月23日随笔"></a>3月23日随笔</h2><p>想把自己看过的文摘总结性质的文章统计下来：<br>（1）刘鹏飞博士总结的文摘趋势和Paperlist：<u><a href="https://zhuanlan.zhihu.com/p/111266615" target="_blank" rel="noopener">https://zhuanlan.zhihu.com/p/111266615</a></u><br>该文总结了近8年以来的所有顶会的文摘论文，非常推荐关注。我在找多模态和生成式论文的时候都是在里面找的。<br>（2）2019 ACL 抛开模型探索文摘本质：<u><a href="https://zhuanlan.zhihu.com/p/76492696" target="_blank" rel="noopener">https://zhuanlan.zhihu.com/p/76492696</a></u><br>顾名思义，探索什么样的文摘是个好文摘。<br>（3）文本摘要的系统性学习：<u><a href="https://zhuanlan.zhihu.com/p/67078700" target="_blank" rel="noopener">https://zhuanlan.zhihu.com/p/67078700</a></u><br>（4）文本自动摘要任务的“不完全”心得总结：<u><a href="https://zhuanlan.zhihu.com/p/83596443" target="_blank" rel="noopener">https://zhuanlan.zhihu.com/p/83596443</a></u><br>该作者主要总结了一些常见的抽取式方法。<br>（5）自己写的综述：<u><a href="https://preprint.nstl.gov.cn/preprint/main.html?action=showFile&amp;id=8a8b8a986ec502f301703cdb19c802f2" target="_blank" rel="noopener">https://preprint.nstl.gov.cn/preprint/main.html?action=showFile&amp;id=8a8b8a986ec502f301703cdb19c802f2</a></u><br>虽然是自己写的，但其实大量参考了以上第（3）和第（4），在此感谢这两篇的作者！写的目的是因为学校毕设的中期检查有综述要求，需要写3K字，但我写了6K，而且被老师说写的太专业了2333，估计之后用于学校检查的时候还得改一改。<br>（6）别人写的综述：更详细更全面的总结<br><u><a href="http://jcip.cipsc.org.cn/CN/Y2019/V33/I5/1" target="_blank" rel="noopener">《文本摘要常用数据集和方法研究综述》</a></u></p>
<p>之后会做一些知识图谱for 文摘/文本标签 的探索。<br>（7）<u><a href="https://zhuanlan.zhihu.com/p/115155771" target="_blank" rel="noopener">《香侬读 | 当知识图谱遇上文本摘要：保留抽象式文本摘要的事实性知识》</a></u><br>（8）<u><a href="https://zhuanlan.zhihu.com/p/89618028" target="_blank" rel="noopener">《知识图谱如何助力文本摘要生成》</a></u><br>（9）<u><a href="https://zhuanlan.zhihu.com/p/84861905" target="_blank" rel="noopener">《知识图谱如何应用到文本标签化算法中》</a></u><br>（10）<u><a href="http://url.cn/5jHjtVG" target="_blank" rel="noopener">《从知识图谱到文本：结合局部和全局图信息生成更高质量的文本》</a></u></p>
<h2 id="3月24日随笔"><a href="#3月24日随笔" class="headerlink" title="3月24日随笔"></a>3月24日随笔</h2><p>总结了一篇文摘DEMO：<u><a href="https://wangjiaan.xyz/2020/03/24/SumDEMO" target="_blank" rel="noopener">《2019 EMNLP 文摘DEMO》</a></u></p>
<h2 id="3月27日随笔"><a href="#3月27日随笔" class="headerlink" title="3月27日随笔"></a>3月27日随笔</h2><p>总结了一下融入知识的摘要生成探讨：<a href="https://wangjiaan.xyz/2020/03/27/KGforSum/" target="_blank" rel="noopener"><u>《融入知识的摘要生成》</u></a></p>
<h2 id="4月16日随笔"><a href="#4月16日随笔" class="headerlink" title="4月16日随笔"></a>4月16日随笔</h2><p>因为最近有一个工程化的项目，所以更希望用抽取式摘要。于是做了一篇关于抽取式摘要的论文笔记：<u><a href="http://wangjiaan.xyz/2020/04/16/ExtSum/" target="_blank" rel="noopener">《抽取式文本摘要》</a></u></p>
<h2 id="4月30日随机"><a href="#4月30日随机" class="headerlink" title="4月30日随机"></a>4月30日随机</h2><p>分享会听到了一个预训练语言模型BART，在生成式文摘当中达到了SOTA，于是记录了一下这篇论文：<u><a href="http://wangjiaan.xyz/2020/04/30/bart/" target="_blank" rel="noopener">《BART》</a></u></p>

            </div>

            <!-- Post Comments -->
            

        </div>
        <!-- Copyright 版权 start -->
                <div id="copyright">
            <ul>
                <li>&copy;2020 北望你的安. 版权所有</li>
            </ul>
            
                <span id="busuanzi_container_site_pv">本站总访问量<span id="busuanzi_value_site_pv"></span>次，</span>
				<span id="busuanzi_container_site_uv"> 访客数 <span id="busuanzi_value_site_uv"></span> 人. </span>
			
			<br>
			<span>友情链接：<a href='http://www.demilab.cn' target='_blank'>DEMI实验室</a>&nbsp;&nbsp;&nbsp;<a href='http://zd11024.cn/' target='_blank'>ZD</a></span>
        </div>
    </div>
</body>



 	
</html>
